الگوریتم های خوشه بندی دوبعدی در داده های بیان ژنی: یک مطالعه مروری

Authors

حمید علوی مجد

hamid alavi majd احمدرضا باغستانی

ahmad reza baghestani سید محمد طباطبائی

seyyed mohammad tabatabaei سوده شهسواری

soodeh shahsavari مصطفی رضایی طاویرانی

abstract

در سال های اخیر تکنولوژی ریز آرایه امکان مشاهده و بررسی بیان هم زمان هزاران ژن را وقتی سلول تحت شرایط مختلف یا پروسه های متفاوت قرار می گیرد را فراهم کرده است و نقشی اساسی در سرعت بخشیدن و بالا رفتن کارایی مطالعات بیان ژنی ایفا می کند. یکی از مهم ترین تکنیک های تشخیص الگو در داده های بیان ژنی تحلیل خوشه بندی دوبعدی است که می تواند گروه هایی از ژن ها با الگو های بیان شده مشابه را بیابد. مطالعه حاضر که یک مطالعه مروری است با هدف ارزیابی پژوهش های موجود در زمینه خوشه بندی دوبعدی بیان ژن و بررسی الگوریتم های مختلف، انجام شده است. در این مطالعه الگوریتم های معرفی شده در سال های 2000 تا 2014 میلادی مورد ارزیابی قرار گرفته است. نتایج جستجو در سایت های مختلف شامل 17الگوریتم اصلی بود که همه آن ها به زبان انگلیسی چاپ شده بودند. با استفاده از نتایج به دست آمده از این مطالعه، بهترین الگوریتم های موجود مربوط به الگوی داده کاوی رابطه بود. اما این تکنیک به این دلیل که از روش جستجوی فراگیر استفاده می کند و همه فضاهای مربوط به خوشه های دوبعدی را پیدا می کند لذا بسیار وقت گیر و پرهزینه است. به نظر می رسد نیاز است بر روی سایر الگوریتم های ارائه شده راه کارهایی جهت رفع مشکلات موجود پیاده کرد تا بتوان نتایج قابل قبول تری به دست آورد.

Upgrade to premium to download articles

Sign up to access the full text

Already have an account?login

similar resources

ارائه یک الگوریتم خوشه بندی برای داده های دسته ای با ترکیب معیارها

Clustering is one of the main techniques in data mining. Clustering is a process that classifies data set into groups. In clustering, the data in a cluster are the closest to each other and the data in two different clusters have the most difference. Clustering algorithms are divided into two categories according to the type of data: Clustering algorithms for numerical data and clustering algor...

full text

نحوه خوشه بندی آماری داده های شکل

اخیرا به کارگیری ابزارهای آمار چندمتغیره برای تحلیل داده هایی که به صورت هندسی تصادفی هستند مورد اقبال محققین علوم کاربردی قرار گرفته است. آمارشکل به عنوان شاخه جدیدی از هندسه تصادفی شامل مجموعه ای از چنین داده هایی است. با این حال، چون چنین داده هایی ماهیت غیراقلیدسی دارند نحوه تطبیق ابزارهای مرسوم چندمتغیره برای تحلیل آماری مناسب آنها تا حدودی واضح نیست. در این مقاله نحوه خوشه بندی داده های آ...

full text

خوشه بندی داده های بیان ژنی و کاربرد آن در تحلیل افتراق انواع سرطان خون

سابقه و هدف: یکی از شاخه های مهم بیوانفورماتیک فناوری ریزآرایه dna است که امکان بررسی بیان هزاران ژن را به طور هم زمان در حداقل زمان ممکن می سازد که در سال های اخیر موجب تولید حجم انبوهی از داده های بیان ژنی شده است. تحلیل آماری این داده ها شامل نرمال سازی، خوشه بندی، طبقه بندی و ... از جمله روش های مورد استفاده در تحلیل این نوع داده ها است. مواد و روش ها: در این مقاله داده های بیان ژنی سرطان خ...

full text

به کارگیری خوشه بندی دوبعدی با روش «زیرماتریس های با میانگین- درایه های بزرگ» در داده های بیان ژنی حاصل از ریزآرایه های dna

مقدمه و هدف: در سال های اخیر، فناوری ریزآرایه ی dna نقش اساسی در تحقیقات ژنومی داشته ­است. با استفاده از این فناوری که امکان آنالیز هم­زمان سطوح بیان هزاران ژن را در شرایط مختلف فراهم­آورده­است، به حجم انبوهی از داده ها دست­می یابیم. روش های کلاسیک خوشه بندی نظیر روش های سلسله مراتبی و غیرسلسله مراتبی، روش هایی مناسب برای تحلیل این­گونه داده ها هستند اما محدودیت هایی نیز دارند. در این روش ها فر...

full text

تحلیل داده های بیماران دیابتی در راستای خوشه بندی و تجویز دارو براساس الگوریتم پیشنهادی

مقدمه: دیابت یک اختلال سوخت و سازی در بدن است که توانایی تولید هورمون انسولین در بدن از بین می‌رود . هدف کلی از انجام پژوهش حاضر کشف دانش نهفته در داده­­های بیماران دیابتی است، که می­تواند به پزشکان در خوشه­بندی بیماران جدید و تجویز داروی مناسب مطابق هر خوشه کمک نماید. روش کار: در این مقاله از الگوریتم MR-VDBSCAN استفاده شده است. پیاده­سازی این الگوریتم د...

full text

ارایه شاخصی جدید جهت سنجش اعتبار خوشه بندی در الگوریتم های خوشه بندی فازی نوع-2

One of the main issues in fuzzy clustering is to determine the number of clusters that should be available before clustering and selection of different values for the number of clusters will lead to different results. Then, different clusters obtained from different number of clusters should be validated with an index. But so far such an index has not been introduced for interval type-2 fuzzy C...

full text

My Resources

Save resource for easier access later


Journal title:
genetics in the 3rd millennium

جلد ۱۲، شماره ۴، صفحات ۳۸۶۴-۳۸۷۱

Hosted on Doprax cloud platform doprax.com

copyright © 2015-2023